要能夠掌握 Big Data, 以現在的說法就是成為資料科學家(Data Scientist), 而要成為資料科學家, 不只要對統計等數學有一定的熟悉度, 也要對企業等相關領域有一定的掌握, 再加上有實作的能力, 也就是對電腦領域有一定的能力, 這三種能力都要具備, 才能成為一個好的資料科學家.
上面兩張圖大概是兩種最常見的定義, 不同的地方就是一個是把專業專成聚焦成 "商業邏輯", 一個是把資訊科學 (Computer Science) 擴大成 "Hacking Skill (實作能力)", 事實上右邊是較為廣泛的定義. *1, *2
但說到這樣, 對大多數的人還是相當模糊的, 要如何成為一個好的 Data Scientist 資料科學家到底要會那些東西, 難道會跑 SASS 不就是一個好的資料工程師嗎? 當然沒那麼簡單, 事實上要成為上面三種領域的任何一種領域的專家已經不是那麼簡單了, 且要同時成為三種領域的專家是談何簡單.
雖然說是很難做到, 但我們真的應該是要嘗試去接近 Approach 這個目標, 而不是看了就放一旁, 透過這個鐵人賽, 我大概嘗試著開書單與課程, 讓大家了解只要認真的學習, 這目標是相當明確而不是做不到.
只是這應該是 14 堂課講不完的, 事實上若是真的講完還寫不了 30 天阿, 所以扣掉引言與結論, 剛好有 28 天, 所以就仿效 "最後 14 堂星期二的課", 來寫成 "成為資料工程師最初的 28 堂課", 所以大家可以準備拉椅子吧....
在還沒有開始, 我先引用國外有一個人寫 "Big Data Engineer" 的特質: *3
資料工程師是一個能夠掌握資料架構, 開發以及應用的工程師, 其中包含幾種能力:
除外, 更能夠:
這樣看起來跟本是個全才阿, 大家怕了嗎? 放心, 明天才開始第一堂課....
*2 右圖: http://www.mitforumatlanta.org/events-listings/2015/data-science-10-1-14.html
*3 http://www.bigdata-startups.com/job-description-big-data-engineer/
就算是簡單的程式設計課程,
都有人質疑這些大補習班的「培訓成效」了
例如這篇的留言 http://ithelp.ithome.com.tw/question/10157364
那麼,這些比較偏重「觀念式」的課程,真的能從補習班短期培訓成功嗎?
(尤其是學員沒有見過大型應用的時候,他們對於資料的Big or small,又怎麼區別呢?)
我也不太懂,只是想聽聽大家意見
也期待前輩這三十天文章,能讓我一窺堂奧。謝謝您